晶体结构表达新方法 | 一种智能化的晶体材料比对算法
北京大学深圳研究生院新材料学院的潘锋教授团队,开发了一种基于图论的晶体结构表达方法,并利用图同构比对算法,将从世界各处收集而来的超过80万种晶体结构数据进行了去重比对,整理出了一个含有62万种无重复结构的晶体材料数据库。
近年来,世界各国都将材料基因组计划及材料数据库建设放在重要位置,高质量的数据库对于发现新材料,创新材料设计方法具有重大意义。这其中,开发出高效自动化的方法对数据库进行筛选、去重是重要基础。然而由于数据库的规模不断扩大以及各种测量误差对结构键长键角的影响,传统的材料识别方法一方面无法实现可靠识别,另一方面方法适应自动化需求。此外,对于更加复杂的材料识别问题,例如区分强相似性结构和高度扭曲结构,都要求开发出准确快速的结构识别方法。
最近,北京大学深圳研究生院潘锋团队自主开发了基于图论的晶体结构比对识别方法,通过将晶体结构的原子作为图中的“点”及成键关系转化为图的“线”连接关系,利用图同构的拓扑信息自动化的对材料数据库中的结构进行识别去重。该方法关注连接与否的拓扑信息,而不需要人为设置判断阈值。利用该方法,成功的从数据库865,458个原始结构中识别出626,772个独特结构,被证明是高效快速的结构比对新范式。
图1 一种基于图论的晶体结构表达方法,并利用图同构比对算法,将从世界各处收集而来的超过80万种晶体结构数据进行了去重比对,整理出了一个含有62万种无重复结构的晶体材料数据库。
该研究成果以“Identify crystal structures by a new paradigm based on graph theory for building materials big data”为题在线发表于SCIENCE CHINA Chemistry。论文第一作者是北京大学深圳研究生院的翁谋毅、王志、钱果裕,通讯作者为潘锋教授。
详见:Mouyi Weng, Zhi Wang, Guoyu Qian, Yaokun Ye, Zhefeng Chen, Xin Chen, Shisheng Zheng, Feng Pan*. Identify crystal structures by a new paradigm based on graph theory for building materials big data. Sci. China Chem., 2019, DOI:10.1007/s11426-019-9502-5.
扫描二维码免费阅读全文
潘锋,北京大学深圳研究生院新材料学院创院院长,国家千人特聘专家和北大讲席教授。1985年获北大化学系学士学位,1994年获英国Strathclyde大学博士学位(获最佳博士论文奖)。在国际大公司具有十多年研发经历,致力于结构化学和能源化学研发。作为首席科学家,自2013年起率领深圳八家单位承担国家新能源汽车(动力电池)创新项目,获得1.5亿元人民币资助。2016年牵头承担国家材料基因工程重点专项。 2015-2018连续四年入选爱思唯尔中国高被引学者;获2018年美国电化学学会电池科技奖。
翁谋毅,博士研究生,现就读于北京大学深圳研究生院新材料学院,主要从事材料数据库搭建和算法开发工作,锂离子电池材料第一性原理计算和第一性原理计算方法开发工作。以第一作者在 J. Phys. Chem. Lett., Appl. Phys. Lett., 等期刊发表SCI论文7篇;并参与构建“北大新材料”数据库。
王志,北京大学深圳研究生院硕士研究生,主要从事基于图论、晶体结构与数据库的相关算法研究。
钱果裕,北京大学深圳研究生院博士后,主要从事锂电池,柔性储能器件和多铁性材料的研究。以第一作者在Adv. Mater., ACS Energy Lett., Nano Energy等杂志发表SCI论文9篇。